Raccourcis clavier importants

pour voir les raccourcis clavier cliquer sur tools puis sur keyboard Shortcuts help oubien cliquer sur Alt + shift + k. Quelques raccourcis que j’utilise régulièrement pour mieux organiser mes syntax:

  • Pour commenter ou enlever un commentaire ctrl + shift + c

  • Pour exécuter une ou des lignes selectionnées ctrl + enter

  • Pour créer une section ctrl + shift + R

  • Pour exécuter une section ctrl + shift + t

  • pour supprimer une ou des lignes ctrl + D

Section 1 Les objets

R permet de manipuler plusieurs bases de données simultanément à travers les objets. Un objet est tout simplement une affectation. Pour créer un objet cliquer sur Alt + 6 ou Alt + -. Dans l’exemlpe ci-desous nous allons créer 3 objets a, b et d

a <- 2
b <- 10
d <- a+b

Pour créer des chaines de caractères il faut mettre l’objet entre quote ” “.

Exemple:

nom <- "abdoulaye"
pays <- "togo"

Section 2 Les vecteurs

Un vecteur correspond à une colonne dans Excel. Pour créer des vecteurs on utilise quatre fonctions : collect c(), répeter rep() et les fonctions séquence : et seq()

prenom <- c("Idrissa", "mawli", "Abdoulaye")
Pays <- c("Senegal", "Togo","Mali")
age <- c(32,35,34)

pour répeter Mawli 100 fois dans une colonne excel on l’écrit 100 fois oubien on l’écrit une fois puis on tire vers le bas pour l’avoir 100 fois. Qu’en est-il s’il faut écrire Mawli 10000 fois ? Avec r il existe une fonction simple qui permet d’écrire mawli 10000 fois en une seule ligne de code. Voici quelques exemples ci-dessous

mawli_10000_fois <- rep("mawli", 10000)
age2 <- c(32,35,rep(34,2))
rep("mawli", 100)
##   [1] "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli"
##  [10] "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli"
##  [19] "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli"
##  [28] "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli"
##  [37] "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli"
##  [46] "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli"
##  [55] "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli"
##  [64] "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli"
##  [73] "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli"
##  [82] "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli"
##  [91] "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli" "mawli"
## [100] "mawli"

Pour des sequences de valeurs successives on utilise la foncion deux points : Pour des séquences avec des pas ou une taille on utilise la fonction seq

testsequence <- 10:30

testsequence2 <- seq(from = 10, to = 100, by = 5)
testsequence3 <- seq(10,100,5)

Pour metre tous ces vecteurs ou colonnes dans la même base de données on utilise la fonction data.frames

donne <- data.frame(prenom, Pays, age)

Base de données

Pour avoir les dimensions d’une base de donnée, ou avoir un aperçu sur les différentes avariables et leur type on utilise respectivement les fonctions dim et str(). Pour avoir le type d’une variable on peut utiliser la fonction class()

# dimension de la base de donnée
dim(donne)
## [1] 3 3
# variables et types
str(donne)
## 'data.frame':    3 obs. of  3 variables:
##  $ prenom: chr  "Idrissa" "mawli" "Abdoulaye"
##  $ Pays  : chr  "Senegal" "Togo" "Mali"
##  $ age   : num  32 35 34
# type de la variable
class(donne$prenom)
## [1] "character"

si vous voulez directement accéder aux variables sans utiliser le symbol $ comme dans l’exemple ci-dessus il faut utiliser la fonction attach()

attach(donne)
## Les objets suivants sont masqués _par_ .GlobalEnv:
## 
##     age, Pays, prenom
class(age)
## [1] "numeric"

importer une base de donnée

Dans cette partie il nous allons importer une base de donnée sans utiliser des packages. Avant d’importer la base il faut d’abord identifier le repertoire de travail grâce à la fonction getwd(). Pour changer le repertoire de travail la fonction setwd() peut être utilisée

getwd()
## [1] "C:/Users/USER MSI/Documents/R Project/initiationFR"
# setwd("C:\\Users\\USER MSI\\Documents\\Data-scientist group")

Dans l’exemple ci-dessous nous allons importer les données du Burkina que vous pouvez télécharger ci-dessous:

Download WFP_2022Jul23_BurkinaFaso_FoodPricesData.csv
getwd()
## [1] "C:/Users/USER MSI/Documents/R Project/initiationFR"
# changer le repertoire de travail
# setwd("votre repertoire") 
dataset <- read.csv("WFP_2022Jul23_BurkinaFaso_FoodPricesData.csv")
str(dataset)
## 'data.frame':    40909 obs. of  11 variables:
##  $ Country    : chr  "Burkina Faso" "Burkina Faso" "Burkina Faso" "Burkina Faso" ...
##  $ Admin.1    : chr  "BOUCLE DU MOUHOUN" "BOUCLE DU MOUHOUN" "BOUCLE DU MOUHOUN" "BOUCLE DU MOUHOUN" ...
##  $ Market     : chr  "Tougan" "Tougan" "Tougan" "Tougan" ...
##  $ Commodity  : chr  "Rice (imported)" "Rice (imported)" "Rice (imported)" "Rice (imported)" ...
##  $ Price.Type : chr  "Retail" "Retail" "Retail" "Retail" ...
##  $ Year       : int  2020 2020 2020 2020 2020 2020 2020 2020 2020 2021 ...
##  $ Month      : int  4 5 6 7 8 9 10 11 12 1 ...
##  $ Price      : num  400 400 400 400 400 400 400 400 400 400 ...
##  $ Unit       : chr  "KG" "KG" "KG" "KG" ...
##  $ Currency   : chr  "XOF" "XOF" "XOF" "XOF" ...
##  $ Data.Source: chr  "SIM/SONAGESS" "SIM/SONAGESS" "SIM/SONAGESS" "SIM/SONAGESS" ...
# Pour tabuler le nombre d'année ou la région
table(dataset$Year)
## 
## 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 
##  132  132  132  132  132  132  132  132  132  132  142  420  438  456  504  480 
## 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 
##  660  711  744  744  762  844  840 3373 3540 4199 4228 4295 4784 4958 2467
table(dataset$Admin.1)
## 
## BOUCLE DU MOUHOUN          CASCADES            CENTRE        CENTRE-EST 
##              6354              1526              2116              3260 
##       CENTRE-NORD      CENTRE-OUEST        CENTRE-SUD               EST 
##              2712              2783              2195              4637 
##     HAUTS-BASSINS              NORD   PLATEAU-CENTRAL             SAHEL 
##              3365              2149              1911              4559 
##         SUD-OUEST 
##              3342

Pour avoir les modalités d’une variable qualitative il faut d’abord changer son type en facteur.

dataset$Admin.1 <- as.factor(dataset$Admin.1)
class(dataset$Admin.1)
## [1] "factor"
# modalités et nombre de modalités
levels(dataset$Admin.1)
##  [1] "BOUCLE DU MOUHOUN" "CASCADES"          "CENTRE"           
##  [4] "CENTRE-EST"        "CENTRE-NORD"       "CENTRE-OUEST"     
##  [7] "CENTRE-SUD"        "EST"               "HAUTS-BASSINS"    
## [10] "NORD"              "PLATEAU-CENTRAL"   "SAHEL"            
## [13] "SUD-OUEST"
nlevels(dataset$Admin.1)
## [1] 13

Exercices

Excercice 1

Créer les vecteurs suivantes

vec1 = 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

vec2 = 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5

vec3 = 1 1 2 2 2 3 3 3 3 4 4 4 4 4

vec4 = idrissa idrissa idrissa idrissa idrissa idrissa Mawli Mawli Mawli Mawli Mawli Mawli Mawli Mawli Mawli Mawli Mawli Abdoulaye Abdoulaye Abdoulaye Abdoulaye Abdoulaye Abdoulaye Abdoulaye Abdoulaye Abdoulaye Abdoulaye Abdoulaye Abdoulaye Abdoulaye Abdoulaye Abdoulaye

Exercice 2

  1. A patir de l’image ci-dessous Choisissez la fonction R appropriée pour enregistrer les données de chacune des variables précédentes dans des vecteurs que vous nommerez Individus, Poids, Taille et Sexe

  2. Calculez la moyenne des variables pour lesquelles cela est possible.

  3. Calculez l’indice de masse corporelle (IMC) des individus et regrouper les valeurs obtenues dans un vecteur nommé IMC. Indication IMC = poids/(taille/100)^2

  4. Créer une base de donnée dans laquelle vous aurez Individus, Poids, Taille, Sexe et IMC

Exercice 3

  1. Importez le fichier base2.csv dans un objet R nommé caracteristique (le fichier est disponible ci-dessous )
Download base2.csv
  1. Combien y a t’il d’individu , de variable ? de quel type sont les variables ?

  2. vérifiez au moyen des fonctions class() et levels() que vos variables sont correctement structurées. Quelles sont les modalités des variables ?

Référence: le logiciel R Maîtriser le langage effectuer des analyses (bio)statistique

Référence: R-for-Statistics